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dE 要 声音 诱发 闪光 错觉 是 指 当 视 觉 闪光 伴随 不 相等 数量 的 听觉 声音 在 100 ms 内 相继 或 
同时 呈现 时 , 个 体会 错觉 性 地 知觉 到 视觉 闪光 的 个 数 与 听觉 声音 的 数量 相等 。 研究 采用 经 典 
的 声音 诱发 闪光 错觉 的 范式 , 将 注意 以 内 源 性 的 方式 指向 视觉 通道 或 者 听觉 通道 ,考察 了 基 
于 通道 的 内 源 性 注意 对 声音 诱发 内 光 错 觉 的 影响 。 结果 发 现 ， 当 注意 内 源 性 地 指向 视觉 通道 
时 ， 相 对 于 基线 条 件 ， 裂变 错觉 的 量 显著 减 小 ， 当 注意 内 源 性 地 指向 听觉 通道 时 ， 相 对 于 基 
线条 件 , 裂变 错觉 的 量 存 在 增 大 的 趋势 。 说 明了 基于 通道 的 内 源 性 注意 可 以 影响 声音 诱发 闪 
光 错 觉 中 的 裂变 错觉 但 不 影响 融合 错觉 。 
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1 引言 

声音 诱发 内 光 错 觉 (sound-induced flash illusion) 是 一 种 听觉 占 主导 性 的 多 感觉 整合 现象 ， 
即 当 视觉 闪光 伴随 不 相等 数量 的 听觉 声音 在 100 ms 内 相继 或 同时 呈现 时 , 个 体会 错觉 性 地 
知觉 到 视觉 闪光 的 个 数 与 听觉 声音 的 数量 相等 。 这 个 现象 说 明了 上 听觉 信息 优先 于 视觉 信息 的 
加 工 , 即 听觉 信息 可 以 主导 视觉 信息 (Abadi & Murphy, 2014; Cecere, Rees, & Romei, 2015; 


van Erp, Philippi, & Werkhoven, 2013; Kamke, Vieth, Cottrell, & Mattingley, 2012; Kumpik, 
Roberts, King, & Bizley, 2014; Shams, Kamitani, & Shimojo, 2000, 2002; Whittingham, 


Mcdonald, & Clifford, 2014). 


声音 诱发 内 光 错 觉 存 在 两 种 


式 , 一 种 是 当 一 个 视觉 内 光 伴随 


NN 


两 个 听觉 声音 时 ， 单 个 视觉 内 光 会 被 错误 知觉 为 两 个 视觉 内 光 ,， 也 被 称 为 裂变 错觉 (fission 
illusion) (Shams et al., 2000, 2002); 另 一 种 是 当 两 个 内 光 伴 随 一 个 听觉 声音 时 ， 两 个 视觉 内 
光 会 被 错误 知觉 为 一 个 视觉 内 光 , 也 被 称 为 融合 错觉 (fusion illusion) (Andersen, Tiippana, & 
Sams，2004)。 研 究 表明 ,相对 于 裂变 错觉 而 言 ,融合 错觉 的 效应 较 弱 (Shams et al., 2000; 
Wozny, Beierholm, & Shams, 2008). 
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自从 Shams 等 人 (2000) 发 现 声音 诱发 内 光 错 觉 现 象 后 , 许多 研究 者 开始 研究 影响 声音 诱 
发 内 光 错 觉 现 象 的 因素 ,研究 者 们 认为 ,来 自 自 上 而 下 (top-dowm) 的 注意 可 以 影响 声音 诱发 内 
光 错 觉 现象 。 以 往 研究 发 现 , 声音 诱发 闪光 错觉 在 第 二 个 听觉 声音 呈现 30~60 ms 后 产生 了 
对 视觉 皮层 活动 幅度 的 早期 调节 作用 (Mishra, Martinez, Sejnowski, & Hillyard, 2007). Mishra, 
Mishra, Martínez 和 Hillyard (2010) 的 研究 进一步 考察 了 刺激 位 置 (高 视野 和 低 视野 ) 与 注意 
(注意 和 不 注意 ) 的 交互 作用 对 声音 诱发 闪光 错 觉 的 影响 。 结 果 表 明 , PD120/110 成 分 (在 低 视 
野 ) 位 于 腹 侧 枕 、 显 外 纹 视觉 皮层 ,而 随后 的 PD180 和 ND250/240 成 分 (在 低 视野 ) 位 于 里 上 
回 ( 枕 颗 皮层 和 蜂 上 回 被 认为 是 多 感觉 通道 信息 产生 交互 的 脑 区 )。 这 些 结果 说 明了 ,声音 诱 
发 闪光 错觉 并 不 全 是 自动 整合 加 工 的 结果 , 还 有 自 上 而 下 的 注意 参与 了 视觉 和 听觉 信号 的 
错误 整合 (Mishra et al., 2010)。 此 外 , Kamke 等 人 (2012) 利 用 经 颅 磁 刺激 (transcranial magnetic 
stimulation,TMS) 研 究 了 声音 诱发 视觉 闪光 错觉 现象 中 与 注意 相关 皮层 神经 网 络 的 作用 。 研 
究 主 要 采用 不 同 的 视听 刺激 组 合 (一 个 视觉 刺激 伴随 两 个 听觉 刺激 ， 一 个 视觉 刺激 ， 两 个 听 
觉 刺 激 ) 与 不 同 的 视听 刺激 的 时 间 间 隔 (70 ms 和 160 ms) REH, 4 TMS 作用 于 右 角 回 
(angular gyrus, AG) 时 ,被 试 报告 闪光 错觉 的 比例 显著 降低 。 因 此 ,他 们 认为 被 破坏 的 角 回 增 
强 了 被 试 在 多 感觉 事件 中 的 真实 知觉 ,有 效 地 降低 了 不 相关 的 听觉 刺激 对 视觉 事件 加 工 的 影 
响 , 并 且 减 少 了 听觉 和 视觉 刺激 错误 整合 的 可 能 性 。 但 是 当 单 一 视觉 刺激 呈现 或 视听 刺激 有 
较 长 的 时 间 间 隔 时 , TMS 不 会 改变 被 试 知觉 。 因 此 ,， 角 回 涉及 在 声音 诱发 闪光 错觉 中 视觉 和 
声音 刺激 整合 的 调节 , 但 是 该 研究 仅 限 于 裂变 错觉 现象 Kamke et al, 2012). 
近期 研究 对 注意 进行 了 内 部 区 分 后 发 现 , 内 源 性 注意 在 多 感觉 整合 中 可 以 以 通道 注意 
(Talsma，2015) 的 形式 影响 多 感觉 整合 过 程 ， 即 对 于 通道 的 注意 会 减弱 被 试 对 不 被 注意 的 
道内 的 信息 加 工 , 在 被 注意 的 通道 内 的 信息 加 工 则 得 到 增强 (Spence, 2011)。 同时 也 有 研究 发 
现 , 相 比 于 注意 一 个 特定 通道 ,注意 两 个 通道 的 成 本 要 更 高 ， 这 个 成 本 与 当 注意 分 配 到 通道 
间 时 在 额 顶 区 或 颗 上 皮层 中 更 为 强烈 的 激活 有 关 (Santangelo, Fagioli, & Macaluso, 2010). i 
期 的 一 项 研究 也 发 现 ,相对 于 注意 一 个 通道 而 言 , 同 时 注意 两 个 通道 可 以 影响 声音 诱发 内 光 
普 觉 现象 ， 说 明了 通道 分 散 的 注意 能 够 影响 声音 诱发 内 光 错 觉 ,但 仅 限 于 裂变 错觉 (于 项 E 
ZE, IKI, 2017)。 关 于 通道 注意 调节 感觉 主导 效应 的 一 个 可 能 的 解释 为 优先 进入 原则 ， 即 
同时 呈现 两 个 刺激 ,被 试 倾向 于 认为 先 注意 到 的 刺激 先 出 现 。 优 先进 入 效应 的 发 生 可 能 是 由 
于 被 试 内 源 性 地 注意 视觉 /听觉 通路 , 也 有 可 能 是 因为 视觉 /听觉 刺激 本 身 的 出 现 外 源 性 地 捕 
捉 了 被 试 的 注意 (Posner, Nissen, & Klein, 1976; Turatto, Benso, Galfano, & Umilta, 2002). 因此， 
当 被 试 将 注意 以 内 源 性 的 方式 指向 视觉 通道 时 , 被 试 会 倾向 于 认为 在 双 通 道 试 次 中 视觉 东 
激 先 于 听觉 刺激 出 现 ， 当 被 试 将 注意 以 内 源 性 的 方式 指向 听觉 通道 时 , 被 试 会 倾向 于 认为 在 
双 通道 试 次 中 听觉 刺激 先 于 视觉 刺激 出 现 。 许 多 研究 采用 不 同 的 方式 将 被 试 的 注意 内 源 性 地 
指向 其 中 一 个 通道 , 其 中 运用 最 普遍 的 便 是 改变 不 同 通道 试 次 出 现 的 比例 。 如 Sinnett, 
Spence 和 Soto-faraco (2007) 在 实验 中 将 单 通道 视觉 目标 的 比例 增加 到 60%, 与 此 同时 单 通道 
听觉 目标 的 比例 减少 至 20% ( 剩 下 的 20% 的 试 次 为 双 通 道 试 次 ) 来 考察 内 源 性 的 通道 注意 对 
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Colavita 视觉 主导 效应 的 影响 ,实验 结果 发 现 Colavita 视觉 主导 效应 变 大 ; 而 当 单 通道 视觉 
目标 的 比例 为 20%， 单 通道 听觉 目标 的 比例 为 60% 时 , Colavita 视觉 主导 效应 变 小 。 因 上 
说 明了 这 样 的 操纵 可 以 成 功 地 将 被 试 的 注意 内 源 性 地 转移 至 出 现 频 次 较 多 的 通道 上 。 

本 研究 在 以 往 研 究 的 基础 上 , 通过 将 注意 内 源 性 地 分 配 到 视觉 通道 或 听觉 通道 ， 考 察 内 
源 性 的 通道 注意 是 否 会 影响 听觉 主导 效应 中 声音 诱发 闪光 错觉 现象 , 即 通过 改变 不 同 通道 
试 次 出 现 的 比例 , 将 被 试 的 注意 内 源 性 地 转移 至 出 现 频次 较 多 的 通道 上 ,考察 内 源 性 地 注意 
视觉 通道 或 听觉 通道 是 否 可 以 影响 声音 诱发 内 光 错 觉 这 种 听觉 主导 效应 。 研 究 采 用 经 典 的 声 
音 诱 发 内 光 错 觉 范式 (Shams et al., 2002), 分 为 3 个 实验 , 实验 1 为 基线 实验 , 即 视觉 通道 试 
次 、 上 听觉 通道 试 次 和 视听 双 通 道 试 次 的 比例 为 1:1:1; 实验 2 为 内 源 性 地 注意 视觉 通道 ， 即 视 
觉 通 道 试 次 、 听 觉 通 道 试 次 和 视听 双 通 道 试 次 的 比例 为 3:1:1; 实验 3 为 内 源 性 地 注意 听觉 
通道 ， 即 视觉 通道 试 次 、 听 觉 通道 试 次 和 视听 双 通 道 试 次 1:3:1。 我 们 假设 内 源 性 地 注意 视 
觉 /听觉 通道 可 以 影响 感觉 主导 效应 的 方向 ,因此 可 以 使 得 声音 诱发 内 光 错 觉 这 种 听觉 占 主 
导 作 用 的 效应 产生 变化 ， 具体 表现 为 当 注 意 内 源 性 地 指向 视觉 通道 时 , 对 视觉 通道 内 信息 的 
神经 反应 被 增强 ， 行 为 结果 表现 为 被 试 判断 视觉 闪光 个 数 的 正确 率 提高 ,进而 表现 出 闪光 错 
觉 效 应 减 小 ; 当 注 意 内 源 性 地 指向 听觉 通道 时 ， 对 听觉 通道 内 信息 的 神经 反应 被 增强 ， 行 为 
结果 表现 为 被 试 判断 视觉 闪光 个 数 更 容易 受到 听觉 声音 刺激 的 干扰 ， 闪 光 错 觉 效 应 增 大 。 


2 实验 1: 基线 实验 
2.1 方法 
2.1.1 被 试 

被 试 为 23 名 大 学 生 (男生 8 人 ,女生 15 A), 年 龄 介 于 18-26 3, 所 有 被 试 视力 正常 或 者 
矫正 视力 正常 , 之 前 均 未 参加 过 类 似 实验 , 实验 后 被 试 获得 一 定 的 报酬 。 
2.1.2 ”实验 仪器 和 实验 材料 

所 有 刺激 呈现 在 iiyama MA203DT Vision Master Pro 513. 型 号 的 显示 器 上 ,屏幕 分 辩 率 
为 1024x768 像素 ,刷新 率 为 85 Hz。 实 验 程序 由 Presentation 软件 编程 (Neurobehavioral 
Systems Inc)， 所 有 视觉 闪光 刺激 呈现 在 黑色 背景 上 。 其 中 视觉 闪光 刺激 为 呈现 在 中 央 注 视点 
下 方 $" 视 角 处 的 白色 圆 盘 ( 视 角 为 2*)， 呈现 的 时 间 为 17 ms。 视觉 内 光 刺 激 呈 现在 中 央 注 视 
点 下 方 5° 视 角 处 是 因为 , 在 听觉 声音 刺激 伴随 下 ,视觉 闪光 刺激 位 于 外 周 视野 时 的 错觉 效应 
最 大 (Shams et al., 2002)。 实 验 中 的 听觉 声音 刺激 通过 头 戴 式 铁 三 角 耳 机 (ATH-WS99) 呈 现 。 
觉 声音 刺激 的 响 度 为 75 dB, 频率 为 3.5 kHz， 呈 现时 间 为 7 ms. 
2.1.3 实验 设计 和 实验 流程 

在 实验 的 每 个 试 次 中 , 给 被 试 呈现 单个 视觉 内 光 刺 激 或 者 连续 的 两 个 视觉 内 光 刺 激 , 在 
呈现 视觉 内 光 刺 激 时 既 可 以 单独 呈现 一 个 视觉 内 光 刺 激 ， 也 可 以 伴随 着 一 个 听觉 声音 刺激 
或 者 连续 的 两 个 听觉 声音 刺激 。 此 外 ,， 既 可 以 单独 呈现 连续 两 个 视觉 内 光 刺 激 ,， 也 可 以 伴随 
一 个 听觉 声音 刺激 或 者 连续 两 个 听觉 声音 刺激 。 除 此 之 外 , 还 可 以 单独 呈现 一 个 听觉 声音 刺 
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激 或 者 单独 呈现 连续 的 两 个 声音 刺激 。 因 此 ,实验 中 所 有 视觉 闪光 刺激 和 听觉 声音 刺激 构成 
了 8 种 实验 条 件 , BI Fl, FIB1, FIB2, F2, F2B1, F2B2, B1 和 B2。 为 了 便于 论述 ,这些 
试 次 类 型 采用 了 上 述 统一 的 表述 方式 。 如 F1B2 是 指 有 一 个 视觉 闪光 刺激 伴随 两 个 听觉 声音 
刺激 的 试 次 , 而 F2 则 是 指 仅 有 两 个 视觉 闪光 刺激 而 无 听觉 声音 刺激 的 试 次 。F1 F2 为 “ 视 
觉 单 通道 刺激 ” B1 和 B2 为 “听觉 单 通道 刺激 ” 其 余 条 件 为 “视听 双 通 道 刺 激 "”。 实 验 流 程 如 
图 1 所 示 , 第 一 个 听觉 声音 刺激 先 于 第 一 个 视觉 闪光 刺激 23 ms 呈现 ， 两 个 视觉 闪光 刺激 的 
时 间 间 隔 为 50 ms， 两 个 听觉 声音 刺激 的 时 间 间 隔 为 57 mso 8 种 实验 条 件 中 可 以 出 现 闪光 错 
觉 的 条 件 是 FIB2 和 F2B1, 即 被 试 针对 同样 的 物理 刺激 既 可 以 产生 错觉 ,也 可 以 不 产生 错 
觉 。 因 此 , 可 以 根据 被 试 的 反应 情况 进行 事后 分 类 ,将 上 述 两 种 条 件 分 成 FIB2_W (有 错觉 
vs. FIB2_R (无 错觉 ) 以 及 F2B1_W (有 错觉 ) vs. F2B1_R (无 错觉 )。 要 求 被 试 在 整个 实验 过 程 
中 是 住 中 央 注 视点 来 判断 他 们 知觉 到 一 个 闪光 刺激 还 是 两 个 闪光 刺激 ,对 于 听觉 单 通道 刺 
激 并 不 需要 做 任何 反应 。 每 个 被 试 需要 完成 512 个 试 次 , 每 种 实验 条 件 下 64 个 试 次 (F1、 
FIBI. F1B2. F2. F2B1, F2B2. B1 和 了 B2) 随 机 呈现 。 试 次 间 的 时 间 间 隔 以 100 ms 为 步 长 
从 400 ms 到 700 ms 随机 。 
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到 1 实验 1 RUAN 


i: FI 为 一 个 视觉 内 光 刺 激 ; F2 为 两 个 视觉 闪光 刺激 ; BL 为 一 个 听觉 声音 刺激 ; B2 为 两 个 听觉 声音 刺激 ; FIBI 为 一 个 视觉 闪光 
刺激 一 个 听觉 声音 刺激 ; F1B2 为 一 个 视觉 闪光 刺激 两 个 听觉 声音 刺激 ; F2B1 为 两 个 视觉 内 光 刺 激 一 个 听觉 声音 刺激 ; F2B2 为 两 
个 视觉 内 光 刺 激 两 个 听觉 声音 刺激 。 彩 图 见 电子 版 。 


2.2 RE 
从 表 1 可 以 看 出 F1、F2、F1B1 和 F2B2 条 件 下 被 试 的 正确 率 都 较 高 ， 也 就 是 说 当 视 觉 
刺激 单独 呈现 或 者 视觉 刺激 与 伴随 的 听觉 刺激 个 数 一 致 时 , 被 试 能 够 较为 准确 地 做 出 判断 。 
此 外 , 根据 被 试 的 反应 情况 进行 事后 分 类 , 将 FIB2 和 F2B1 这 两 种 可 产生 错觉 的 条 件 分 成 
FIB2_W (有 错觉 ,也 称 之 为 裂变 错觉 ) vs. F1B2_R (无 错觉 , 即 正确 按键 ) 以 及 F2B1_W (有 错觉 ， 
也 称 之 为 融合 错觉 ) vs. F2B1_R (无 错觉 , 即 正 确 按 键 )。 通 过 表 1 可 以 看 出 , F1B2 条 件 的 正确 
率 为 34%， 显 著 小 于 F1、F1B1、F2 和 F2B2 条 件 下 的 正确 率 (ps < 0.001), F2B1 条 件 的 正确 
率 为 62%， 显 著 小 于 FE1、F1B1、F2 和 F2B2 条 件 下 的 正确 率 (ps < 0.001)。 对 于 视觉 刺激 与 
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听觉 刺激 不 匹配 的 条 件 (E1B2 条 件 和 F2B1 条 件 )， 从 正确 率 的 角度 来 看 ， 出现 了 听觉 主导 效 
应 ， 即 听觉 刺激 的 个 数 会 影响 对 视觉 刺激 个 数 的 判断 。 


表 1 三 个 实验 各 条 件 下 的 正确 率 平 均 数 和 标准 差 (%) 


实验 Fl FIBI F1B2 F2 F2B1 F2B2 
实验 1 90+8 94+8 34+24 89+6 62+21 92+9 
实验 2 9026 9246 50 +22 8747 68 +23 96 +4 
实验 3 90 +7 94 +6 29 + 26 88 +8 64 + 25 9723 


ES FI 为 一 个 视觉 闪光 刺激 ; F2 为 两 个 视觉 闪光 刺激 ; FE1B1 为 一 个 视觉 闪光 刺激 一 个 听觉 声音 刺激 ; F1B2 为 一 个 视觉 闪光 刺激 
两 个 听觉 声音 刺激 ; F2B1 为 两 个 视觉 闪光 刺激 一 个 听觉 声音 刺激 ; F2B2 为 两 个 视觉 闪光 刺激 两 个 听觉 声音 刺激 。 
3 实验 2， 基于 视觉 通道 的 内 源 性 注意 对 声音 诱发 闪光 错觉 的 影响 
31 方法 
3.1.1 被 试 

被 试 为 25 名 大 学 生 ( 男 生 9 A, 女生 16 人 ), 年 龄 介 于 18~26 岁 ， 所 有 被 试 视力 正常 或 者 
矫正 视力 正常 , 之 前 均 未 参加 过 类 似 实验 , 实验 后 被 试 获得 一 定 的 报酬 。 
3.1.2 ”实验 仪器 和 实验 材料 

实验 仪器 和 实验 材料 同 实验 1。 
3.1.3 ”实验 设计 和 实验 流程 

实验 设计 和 实验 流程 同 实验 1. 不 同 的 是 , 实验 将 “视觉 单 通道 刺激 *、“ 听 觉 单 通道 刺激 ” 
和 “视听 双 通 道 刺激 ”的 比例 设置 为 3:1:1。 被 试 的 任务 是 在 整个 实验 过 程 中 都 要 求 盯 住 中 央 
注视 点 , 判断 他 们 知觉 到 一 个 视觉 闪光 刺激 还 是 两 个 视觉 闪光 刺激 ,针对 Bl 和 B2 条 件 则 无 
需 按键 反应 。 每 个 被 试 需要 完成 768 个 试 次 , 其 中 F1 和 F2 条 件 下 各 192 个 试 次 ,其 余 各 实 
验 条 件 下 各 64 个 试 次 (FI1B1、F1B2、F2B1、F2B2、B1 和 B2), 所 有 刺激 随机 呈现 。 试 次 间 
的 时 间 间 隔 以 100 ms 为 步 长 从 400 ms 到 700 ms 随机 。 
32 ”结果 与 分 析 

从 表 1 可 以 看 出 F1、F2、F1B1 和 F2B2 条 件 下 被 试 的 正确 率 都 较 高 ， 也 就 是 说 当 视 觉 
刺激 单独 呈现 或 者 视觉 刺激 与 伴随 的 听觉 刺激 个 数 一 致 时 , 被 试 能 够 较为 准确 地 做 出 判断 。 
此 外 , 根据 被 试 的 反应 情况 进行 事后 分 类 , 将 FIB2 和 F2B1 这 两 种 可 产生 错觉 的 条 件 分 成 
FIB2_W (有 错觉 ,也 称 之 为 裂变 错觉 ) vs. FIB2_R (无 错觉 ， 即 正 确 按键 ) 以 及 F2B1_W (有 错 
dk, 也 称 之 为 融合 错觉 ) vs. F2B1_R (无 错觉 ， 即 正确 按键 )。 通 过 表 1 可 以 看 出 , FIB2 条 件 的 
正确 率 为 50%， 显著 小 于 Fl. FIBI. F2 和 F2B2 条 件 下 的 正确 率 (ps < 0.001), F2B1 条 件 的 
正确 率 为 68%， 显著 小 于 Fl1、F1Bl1、F2 和 F2B2 条 件 下 的 正确 率 (ps < 0.001)。 对 于 视觉 刺 
激 与 听觉 刺激 不 匹配 的 条 件 (F1B2 条 件 和 F2B1 条 件 )， 从 正确 率 的 角度 来 看 ,出 现 了 听觉 主导 
效应 , 即 听 觉 刺激 的 个 数 会 影响 对 视觉 刺激 个 数 的 判断 
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4 实验 3: 基于 听觉 通道 的 内 源 性 注意 对 声音 诱发 闪光 错 觉 的 影响 
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41 方法 
4.1.1 被 试 

被 试 为 24 名 大 学 生 ( 男 生 9 A, 女生 15 人 ), 年 龄 介 于 18~26 岁 ， 所 有 被 试 视力 正常 或 者 
矫正 视力 正常 , 之 前 均 未 参加 过 类 似 实验 , 实验 后 被 试 获得 一 定 的 报酬 。 
4.1.2 实验 仪器 和 实验 材料 

实验 仪器 和 实验 材料 同 实验 1。 
4.1.3 ”实验 设计 和 实验 流程 

实验 设计 和 实验 流程 同 实验 1. 不 同 的 是 , 实验 将 “视觉 单 通道 刺激 *、“ 听 觉 单 通道 刺激 ” 
和 “视听 双 通 道 刺激 ”的 比例 设置 为 1:3:1。 被 试 的 任务 是 在 整个 实验 过 程 中 都 要 求 果 住 中 央 
注视 点 , 判断 他 们 知觉 到 一 个 视觉 闪光 刺激 还 是 两 个 视觉 闪光 刺激 ,针对 Bl 和 B2 条件 则 无 
需 按键 反应 。 每 个 被 试 需要 完成 768 个 试 次 , 其 中 Bl 和 B2 条 件 下 各 192 个 试 次 ,其 余 各 实 
验 条 件 下 各 64 个 试 次 FI1、F1B1、F1B2、F2、F2B1 和 F2B2)， 所 有 刺激 随机 呈现 。 试 次 间 
的 时 间 间 隔 以 100 ms 为 步 长 从 400 ms 到 700 ms 随机 。 
42 ”结果 与 分 析 

从 表 1 可 以 看 出 F1、F2、F1B1 和 F2B2 条 件 下 被 试 的 正确 率 都 较 高 ， 也 就 是 说 当 视 觉 
刺激 单独 呈现 或 者 视觉 刺激 与 伴随 的 听觉 刺激 个 数 一 致 时 ,被 试 能 够 较为 准确 地 做 出 判断 。 
此 外 , 根据 被 试 的 反应 情况 进行 事后 分 类 , 将 FIB2 和 F2B1 这 两 种 可 产生 错觉 的 条 件 分 成 
FIB2_W (有 错觉 , 也 称 之 为 裂变 错觉 ) vs. FIB2_R (无 错觉 , 即 正确 按键 ) 以 及 F2B1_W (有 错 
觉 ， 也 称 之 为 融合 错觉 ) vs. F2B1_R (无 错觉 ， 即 正确 按键 ), 通 过 表 1 可 以 看 出 , F1B2 条 件 的 
E 确 率 为 29%， 显著 小 于 Fl、F1B1、F2 和 F2B2 条 件 下 的 正确 率 (ps < 0.001), F2B1 条 件 的 
正确 率 为 64%， 显 著 小 于 Fl1、FlB1、F2 和 F2B2 条 件 下 的 正确 率 (ps < 0.001)。 对 于 视觉 刺 
激 与 听觉 刺激 不 匹配 的 条 件 (E1B2 条 件 和 F2B1 条 件 )， 从 正确 率 的 角度 来 看 ， 出 现 了 听觉 主 
导 效 应 ， 即 听觉 刺激 的 个 数 会 影响 对 视觉 刺激 个 数 的 判断 。 
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5 结果 综合 分 析 


51 正确 率 
将 实验 1、 实验 2 和 实验 3 中 视觉 闪光 刺激 与 听觉 声音 刺激 个 数 不 匹 配 试 次 (FI1B2 条 件 
All F2B1 条 件 ) 的 正确 率 进 行 3 (实验 1 vs. 实验 2 vs. 实验 3) x 2 (FIB2 vs. F2B1) 的 重复 测量 
方差 分 析 。 结 果 发 现 , 不 同 实验 的 主 效应 显著 ,已 (1, 22) = 4.01, p < 0.05, n= 0.16; 错觉 条 件 的 
主 效 应 显著 , F (1, 22) = 60.73, p < 0.001, n?= 0.73; 两 者 的 交互 作用 不 显著 , F (1, 22) = 1.16, 
p > 0.05。 为 了 进一步 考察 F1B2 和 F2B1 条 件 下 各 个 实验 的 潜在 差异 , 将 F1B2 和 F2B1 条 件 
下 各 个 实验 进行 单 因 素 的 方差 分 析 ， 考察 内 源 性 注意 视觉 通道 和 内 源 性 注意 听觉 通道 对 声 
音 诱 发 内 光 错 觉 中 裂变 错觉 和 融合 错觉 的 影响 (图 2)。 结 果 发 现 , 在 F1B2 条 件 下 , 不 同 实验 
间 差 异 显 著 , F (1,2) 25.11, p «0.01, n= 0.23。 事 后 检验 结果 显示 ， 实 验 1 和 实验 2 之 间 差 异 
显著 (p < 0.05); 实验 2 和 实验 3 之 间 差 异 显著 (p < 0.005); 而 实验 1 和 实验 3 之 间 差 异 不 显著 
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s 0.05). 在 F2B1 条 件 下 , 不 同 实 验 间 差异 不 显著 (ps 


道 的 内 源 性 注意 可 以 影响 声音 诱发 内 光 错 觉 中 的 裂变 错 


觉 通道 的 内 源 性 注意 条 件 下 F1B2 的 正确 率 显 著 增 加 ， 
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> 0.05). 因此 ， 从 结果 上 可 以 看 出 , d 
觉 (F1B2),， 具体 表现 在 , 基于 视 
而 基于 听觉 通道 的 内 源 性 注意 条 件 下 


F1B2 的 正确 率 减 少 , 但 不 显著 。 内 源 性 注意 视觉 通道 和 内 源 性 注意 听觉 通道 间 F1B2 的 正确 


率 存在 显著 差异 。 而 对 于 声音 诱发 内 光 错 觉 中 的 融合 错 党 
道 注意 所 影响 。 


m 


Prez F391 


觉 (F2B1) 而 言 ,其 并 不 受 内 源 性 的 通 


图 2 FIB2 和 F2B1 的 正 


SEAT 


确 率 在 三 种 实验 间 的 差 


比较 


iE: FIB2 为 一 个 视觉 内 光 刺 激 两 个 听觉 声音 刺激 ; F2B1 为 两 个 视觉 内 光 刺 激 一 个 听觉 声音 刺激 。 


觉 和 融合 错觉 是 一 个 稳定 且 普 遍 的 现象 , 但 每 个 人 的 错觉 量 


a FETE EFF Al, 


为 了 避免 这 种 个 体 差异 ，Andersen 等 人 (2004) 采 用 了 一 
觉 效 应 量 的 大 小 , 这 个 指标 即 比值 比率 。 求 比值 比率 ， 
产生 裂变 错 1 
呈现 的 闪光 个 数 ) 的 试 次 数 ,二 者 的 差 值 就 是 没有 产生 
的 试 次 总 数 与 没有 产生 裂变 错觉 的 试 次 数量 进行 比较 ， 
道 条 件 下 相应 的 比值 ( 单 通道 条 件 下 能 产生 裂变 错觉 的 


个 新 的 指标 来 表示 裂变 错觉 和 融合 错 
首先 要 将 所 有 被 试 在 双 通 道 条 件 下 能 


觉 的 试 次 总 数 求 出 ， 接 着 求 出 其 中 真正 产生 裂变 ( 即 感觉 到 的 闪光 个 数 多 于 实际 


裂变 错觉 的 试 次 数 , 用 产生 裂变 错觉 
可 以 得 到 一 个 比值 。 同 理 , 求 出 单 通 
试 次 即 闪光 个 数 与 双 通 道 条 件 下 闪光 


个 数 一 致 的 试 次 )。 将 这 两 个 比值 


再 进行 inn 


得 到 的 比值 比率 和 


E 更 清晰 地 反映 出 裂变 错觉 


的 效应 量 


小 。 


当 比 值 比率 大 于 1 


FEK, BNI 


的 时 候 ， 说 明 在 双 通 道 条 们 


F 下 产生 的 裂变 错觉 比 单 通道 条 


觉 声 音 影 响 了 对 视觉 闪光 的 判断 ， 比 值 比率 的 值 越 大 , 说明 错觉 效应 量 越 


大 。 


了 裂变 错 
和 表 3)。 从 表 2 和 表 3 中 可 以 看 出 , 无 论 是 在 实验 1、 实验 2 
觉 的 效应 都 更 大 。 此 外 ， 也 能 够 反映 出 FIB2 条 件 下 ,实验 1 和 实验 2 存在 
但 实验 1 和 实验 3 之 间 并 不 存在 显著 差异 ; F2BI 


错觉 而 言 e Ag 
显著 差异 ,实验 2 和 实验 3 存在 显著 差异 ， 


AM 


融合 错觉 的 计算 与 此 一 致 (Andersen et al., 2004). 4HE Andersen “ 
觉 和 融合 错觉 的 量 ,也 能 够 更 加 清晰 地 比较 出 不 同 实验 条 件 下 错 1 


等 人 (2004) 的 算法 计算 
觉 效应 的 大 小 ( 表 2 


2 还 是 在 实验 3 中 ,相对 于 融合 


F 下 ,三 个 实验 之 间 并 不 存在 显著 差异 。 


R2 各 实验 中 裂变 错觉 的 比值 比率 


实验 1 实验 2 实验 3 
刺激 类 型 
裂变 错觉 ”无 裂变 总 数 裂变 错觉 “无 裂变 总 数 裂变 错觉 ”无 裂变 总数 
视听 刺激 972 500 1472 800 800 1600 1091 445 1536 
视觉 刺激 147 1325 1472 480 4320 4800 154 1382 1536 
比值 比率 17.5 9 21.95 
表 3 各 实验 中 融合 错觉 的 比值 比率 
实验 1 实验 2 实验 3 
融合 错觉 《无 裂变 总 数 融合 错觉 ”无 裂变 总数 融合 错觉 ”无 裂变 总 数 
视听 刺激 559 913 1472 512 1088 1600 553 983 1536 
视觉 刺激 162 1310 1472 624 4176 4800 184 1352 1536 
4.95 3.15 4.13 


比值 比率 : ; 


52 RMA 


将 F1B2 fü F2B1 条 件 下 不 同 实 验 间 的 反应 时 进行 3 (实验 
F1B2_R vs. F1B2 W vs. F2B1_R vs. F2B1_W) 的 混 


T 


3) x 4 (KH 
4) ARRI, KA 
(3, 69) = 124.81, p < 
r= 0.07. ASH 


步 了 解 不 同 实验 和 裂变 错觉 、 


: 实验 1 vs. 实验 2 vs. 实验 


合 重 


的 主 效应 显著 , F (1,2) 
0.001, n?2 0.64; 实验 与 条 件 的 交互 作 
融合 错觉 


之 间 潜 在 


= 23.91, p < 0.001, ?2 0.41; 
1, F (6, 69) = 


EE 复 测量 方差 分 析 ( 见 表 
条 件 的 主 效应 显著 , F 
2.47, p < 0.05, 
的 交互 关系 ,我 们 分 别 


将 不 同 实 验 下 的 FIB2_R fl F1B2, W 以 及 F2B1_R 和 F2B1_W 进行 比较 分 析 。 结果 发 现 ， 实 


验 1 中,F1B2_R 条 件 


下 的 反应 时 (889 ms) 显 著 长 于 F1B2_W 条 人 


下 的 反应 时 (710 ms), t (24) = 5.44, p < 0.001, d = 1.56; Scl; 3 4 
(732 ms) 显 著 长 于 F1B2_W 条 件 下 的 反应 时 (707 ms), t (23) = 2.15, p < 


实验 1、 实 验 2 以 及 实验 3 P, F2B1_R 条 件 下 的 反应 时 和 F2B1_W 条 伯 
无 显著 差异 ， 具体 结果 为 , 实验 1 中 , F2B1_R 条 从 


反应 时 (762 ms) 间 无 显著 差异 ,1 < 1; 实验 2 中 , F2B1_R 条 从 
条 件 下 的 反应 时 间 无 显著 差异 (639 ms), t < 1; 实验 3 rp, F2B1_R 条 人 


FIB2_W Aft FARA 


应 时 无 显著 差异 (613 ms), 1 (23) = 1.99, p > 0.05. 


F 下 的 反应 时 (839 ms), t (22) = 
4.07, p = 0.001, d = 1.22; 实验 2 H, FIB2_R 条 件 下 的 反应 时 (798 ms) 显 著 长 于 FlB2_W Af 
P, FIB2_R 条 件 下 的 反应 时 


0.05,d = 0.63。 但 是 在 
F 下 的 反应 时 之 间 均 


F 下 的 反应 时 (757 ms) 和 F1B2_W 条 件 下 的 
FE 下 的 反应 时 (640 ms) 和 F1B2_W 
FE 下 的 反应 时 (581 ms) 和 


表 4 各 实验 F1B2 和 F2B1 条 件 下 的 反应 时 平均 数 和 标准 差 (ms) 
实验 FIB2 R FIB2 W F2B1_R F2B1_W 
实验 1 889 + 90 839 + 70 757 +83 762 +92 
实验 2 798 +95 710 + 108 640 + 104 639 + 88 
实验 3 732 + 89 707 + 76 581 + 86 


实验 + + ES 613 +99 
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ik: FIB2_R 为 一 个 视觉 闪光 刺激 两 个 听觉 声音 刺激 ,并 未 产生 错觉 条 件 ; F1B2, W 为 一 个 视觉 闪光 刺激 两 个 听觉 声音 e 产生 
错觉 条 件 ; F2B1_R 为 两 个 视觉 闪光 刺激 一 个 听觉 声音 刺激 , 并 未 产生 错觉 条 件 ; F2B1_W 为 两 个 视觉 闪光 刺激 一 个 听觉 声音 刺激 
产生 错觉 条 件 。 


上 述 分 析 的 结果 表明 , 在 FIB2 条 件 中 (裂变 错觉 )， 相 对 于 有 错觉 条 件 (F1B2_W), 无 错 
觉 条 件 下 (F1B2_R) 的 反应 时 都 明显 增长 ， 即 被 试 需要 付出 更 多 注意 资源 才能 正确 辨别 视觉 
闪光 刺激 的 个 数 ， 这 种 现象 无 论 在 实验 1 (50 ms)、 实 验 2 (88 ms) 还 是 实验 3 (26 ms) 都 存在 。 
将 三 个 实验 中 F1B2_R 和 Fl1B2_W 的 差 值 进 行 单 因素 方差 分 析 , 结果 发 现 显著 性 差异 , F (2, 
68) = 4.61, p < 0.05, ņ = 0.22。 进 一 步 事 后 检验 发 现 , 实验 1 和 实验 2 之 间 差 异 不 显著 (p > 
0.05), 实验 1 和 实验 3 之 间 差 异 不 显著 (p > 0.05), 但 实验 2 和 实验 3 之 间 差 异 显著 (p < 0.005). 
研究 结果 说 明 , 不 管 是 否 存在 注意 的 影响 ,以 及 内 源 性 注意 视觉 通道 还 是 听觉 通道 ,裂变 错 
觉 这 种 听觉 主导 效应 的 现象 均 稳定 存在 。 然 而 , 在 F2B1 条 件 中 (融合 错觉 )， 有 错觉 条 件 
(F2B1_W) 与 无 错觉 条 件 下 (F2B1_R) 的 反应 时 之 间 并 无 显著 差异 ， 这 种 现象 在 三 个 实验 同样 
FE, 说 明了 不 管 是否 存 在 注意 的 影响 ， 以 及 内 源 性 注意 视觉 通道 还 是 听觉 通道 , 融合 错觉 
这 种 听觉 主导 效应 的 现象 在 反应 时 水 平 上 并 未 得 到 体现 。 

此 外 , 为 了 比较 不 同 的 实验 之 间 F1B2_W 和 F2B1_W 的 差异 , 即 不 同 内 源 性 注意 操纵 条 
EF, 裂变 效应 和 融合 效应 相应 的 变化 , 我 们 将 F1B2_W 和 F2B1_W 条 件 下 不 同 实验 间 的 有 反 
应 时 分 别 进行 了 单 因 素 方差 分 析 ( 实 验 1 vs. 实验 2 vs. 实验 3)。 结 果 发 现 , 在 F1B2_W 条 件 
下 ,不 同 实 验 间 的 反应 时 差异 显著 ,下 (2, 69) = 17.49, p < 0.001, 22 0.37. 事后 检验 结果 显示 ， 
实验 1 和 实验 2 之 间 差 异 显著 p < 0.001); 实验 1 和 实验 3 之 间 差 异 显著 (p < 0.001); 而 实验 
2 和 实验 3 之 间 差 异 不 显著 (p > 0.05)。 在 FE2B1_W 条件 下 , 不 同 实验 间 的 反应 时 差异 显著 了 (2, 
69) = 16.94, p < 0.001, ?= 0.35。 事 后 检验 结果 显示 ,实验 1 和 实验 2 之 间 差 异 显著 (p < 0.001); 
实验 1 和 实验 3 之 间 差 异 显 著 (p < 0.001); 而 实验 2 和 实验 3 之 间 差 异 不 显著 (p > 0.05)。 


6 讨论 
ee 过 将 注意 内 源 性 地 


分 配 到 视觉 通道 或 听觉 通道 ， 即 通过 改变 不 同 通道 试 次 出 现 的 比例 , 将 被 试 的 注意 内 源 性 地 
转移 至 出 现 频次 较 多 的 通道 上 ,考察 内 源 性 地 注意 视觉 通道 或 听觉 通道 是 否 可 以 影响 声音 
诱发 闪光 错觉 这 种 听觉 主导 效应 ,研究 结果 发 现 , 存在 经 典 的 声音 诱发 内 光 错 觉 现象 ,并 且 裂 
变 错觉 的 效应 大 于 融合 错觉 的 效应 。 此 外 , 研究 还 发 现 ， 当 注意 内 源 性 地 指向 不 同感 觉 通 道 
时 会 影响 裂变 错觉 的 大 小 , 但 并 不 影响 融合 错觉 的 大 小 。 具 体 表 现 为 ， 当 注意 内 源 性 地 指向 
视觉 通道 时 ,相对 于 基线 条 件 ， 裂变 错觉 的 量 显 著 减 小 (图 2); 当 注 意 内 源 性 地 指向 听觉 通道 
时 ， 相 对 于 基线 条 件 , 裂变 错觉 的 量 增 大 , 但 与 基线 条 件 差异 不 显著 (图 2)。 本 研究 之 所 以 将 
比例 操纵 作为 被 试 间 变量 的 原因 有 : 其 一 ， 由 于 目前 的 实验 时 间 已 经 较 长 ,加 之 实验 环境 为 
低 亮度 的 屏蔽 室内 ,实验 材料 的 呈现 方式 是 白色 内 光 呈 现在 黑色 背景 上 ,刺激 的 对 比 很 强 ， 
如 果 将 3 个 实验 整合 为 一 个 实验 , 实验 的 时 间 比 较 长 , 被 试 会 产生 疲劳 效应 ; 其 二 ， 声音 诱 
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发 闪光 错 觉 是 一 种 非常 稳定 的 听觉 主导 效应 ,虽然 在 声音 诱发 内 光 错 觉 这 一 现象 中 存在 个 
体 差异 , 但 是 从 总 体 上 来 看 ,实验 中 每 个 被 试 都 存在 这 种 错觉 效应 ， 尽管 有 的 被 试 错觉 量 较 
大 ,有 的 较 小 。 此 外 , 对 于 实验 1, 我 们 前 期 用 多 批 被 试 做 过 多 次 重复 实验 , 其 结果 基本 一 致 
(也 见于 微 等 , 2017)。 因此， 本 研究 将 比例 调控 设置 为 被 试 间 变 量 并 不 会 受到 被 试 的 差异 而 对 
实验 结 采 产 生 影响 。 其 三 ,在 Colavita 视觉 主导 效应 的 研究 中 , Sinnett 等 人 (2007) 也 是 在 不 同 
的 实验 中 (被 试 不 同 ), 设置 了 不 同 通道 刺激 的 比例 , 研究 结果 发 现 了 通过 比例 设置 操纵 的 内 
源 性 通道 注意 可 以 影响 Colavita 视觉 主导 效应 的 大 小 。 

从 正确 率 的 结果 上 来 看 , 本 研究 3 个 实验 均 发 现 经 典 的 声音 诱发 内 光 错 觉 听觉 主导 效应 ， 
并 且 裂 变 错 觉 效 应 大 于 融合 错觉 ， 这 与 以 往 研 究 结果 一 臻 (Shams et al, 2000, 2002; Shams, 
Ma, & Beierholm, 2005; Watkins, Shams, Tanaka, Haynes, & Rees, 2006; Watkins, Shams, 
Josephs, & Rees, 2007; Wozny et al., 2008; FEE, 2017)。 除 此 之 外 , 本 研究 发 现 裂变 错觉 会 
受到 内 源 性 通道 注意 的 影响 , 但 融合 错觉 则 不 会 受 内 源 性 通道 注意 的 影响 (图 2)。 原 因 在 于 ， 
首先 ， 以 往 研 究 发 现 ， 相 对 于 裂变 错觉 ， 融 合 错觉 不 稳定 (Shams et al., 2000; Wozny et al., 
2008)， 表 现 为 裂变 错觉 这 种 错觉 效应 尽管 改变 诸如 形状 、 对 比 度 、 大 小 、 视 觉 刺 激 呈 现 的 
司 、 频 率 和 强度 、 听 觉 刺激 的 呈现 时 间 ， 以 及 视觉 刺激 和 听觉 刺激 在 时 间 上 和 空间 上 的 相 
对 位 置 等 条 件 仍然 稳定 存在 (Shams et al., 2000, 2002; Shams et al., 2005; Watkins et al., 2006; 
o Watkins et al., 2007)。 其 次 ,裂变 错觉 会 受到 注意 资源 的 影响 而 产生 错觉 量 大 小 的 变化 , 但 是 
融合 错觉 并 不 受到 注意 资源 的 影响 。 上 基体 表现 为 ,相对 于 注意 只 集中 在 视觉 单 通道 条 件 下 ， 
当 注 意 既 分 配 到 视觉 通道 也 分 配 到 听觉 通道 时 ,裂变 错觉 量 减 小 , 而 融合 错觉 不 受 其 影响 
(于 微 等 ,2017)。 以 往 研 究 表明 ,注意 除 能 指向 某 一 空间 位 置 外 ,还 能 指向 某 一 感觉 通 ; 
(Talsma，2015)， 即 对 被 注意 的 通道 内 的 信息 加 工 得 到 增强 ， 而 对 不 被 注意 的 通道 内 的 信息 
加 工 则 得 到 减弱 ( 顾 吉 有 ， 吕 勇 , 2016; Spence, 2011; 孙 远 路 等 , 2011)。 因 此 ， 当 注意 指向 一 
个 感觉 通道 时 ,对 此 通道 内 信息 的 神经 反应 被 增强 ,而 对 被 忽视 通道 内 信息 的 神经 反应 则 被 
抑制 。 声 音 诱发 内 光 错 觉 现象 是 多 感觉 整合 中 的 一 种 听觉 主导 现象 , 涉及 到 视觉 和 听觉 两 个 

道 ， 本 研究 中 , 将 注意 内 源 性 地 指向 视觉 通道 时 , 对 视觉 通道 内 信息 的 神经 反应 被 增强 ， 
行为 结果 表现 为 被 试 判 断 视觉 内 光 个 数 的 正确 率 提高 ,进而 表现 出 裂变 错觉 效应 减 小 (图 2 和 
表 2); 而 将 注意 内 源 性 地 指向 听觉 通道 时 ， 对 听觉 通道 内 信息 的 神经 反应 被 增强 ， 行 为 结果 
表现 为 被 试 判 断 视觉 内 光 个 数 更 容易 受到 听觉 声音 刺激 的 干扰 ,使 得 被 试 反 应 的 正确 率 下 
降 ， 进 而 表现 出 裂变 错觉 效应 增 大 的 趋势 (图 2 和 表 2)。 

本 研究 通过 比例 设置 的 方式 将 注意 内 源 性 地 指向 视觉 通道 和 听觉 通道 , 结果 也 发 现 ， 同 
Colavita 视觉 主导 效应 一 样 ， 声音 诱发 双 内 光 错 觉 (裂变 错觉 ) 也 会 受到 内 源 性 通道 注意 的 影 
响 ， 使 得 裂变 错觉 的 效应 减 小 或 增 大 。 研究 结果 与 Sinnett 等 人 (2007) 考 察 内 源 性 的 通道 注意 
对 Colavita 视觉 主导 效应 影响 的 结果 一 致 ， 发现 了 通过 比例 设置 操纵 的 内 源 性 通道 注意 可 以 
影响 感觉 主导 效应 的 大 小 。 实验 2 中 注意 内 源 性 地 指向 视觉 通道 , 实验 3 中 注意 内 源 性 地 指 
向 听觉 通道 。 这 里 我 们 强调 的 是 不 同感 觉 通 道 的 注意 ,研究 中 实验 任务 为 判断 视觉 通道 刺激 
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的 个 数 , 因此 ， 当 注意 内 源 性 地 指向 视觉 通道 时 ， 听 觉 通 道 的 刺激 被 试 并 不 需要 注意 , 因此 
可 以 视 为 集中 注意 视觉 单一 通道 。 但 是 当 注 意 内 源 性 地 指向 听觉 通道 时 , 被 试 一 方面 需要 注 
意 听觉 通道 的 刺激 ， 另 一 方面 也 需要 注意 视觉 通道 的 刺激 (任务 需求 ), 因 此 可 以 视 为 分 散 注 
意 视觉 通道 和 听觉 通道 。 有 研究 发 现 , 相 比 于 注意 一 个 特定 通道 , 注意 两 个 通道 的 成 本 要 更 
高 ， 这 个 成 本 与 当 注意 分 配 到 通道 间 时 额 顶 区 或 里 上 皮层 中 更 为 强烈 的 激活 有 关 (Degerman 
et al., 2007; Santangelo et al., 2010) 。 我 们 近期 的 一 项 研究 也 发 现 , 相对 于 注意 一 个 通道 而 言 ， 
同时 注意 两 个 通道 可 以 影响 声音 诱发 内 光 错 觉 现象 ,说 明了 通道 分 散 的 注意 能 够 影响 声音 
诱发 内 光 错 觉 (于 薇 等 , 2017)。 关 于 通道 注意 调节 感觉 主导 效应 的 一 个 可 能 的 解释 为 优先 进 
入 原则 ， 即 同时 呈现 两 个 刺激 ， 先 注意 到 的 刺激 被 试 倾向 于 认为 其 先 出 现 。 优 先进 入 效应 的 
发 生 可 能 是 由 于 被 试 内 源 性 地 注意 视觉 /听觉 通路 ,也 有 可 能 是 因为 视觉 /听觉 刺激 本 身 的 出 
现 外 源 性 地 捕捉 了 被 试 的 注意 (Posner et al., 1976; Turatto et al., 2002)。 因 此， 当 被 试 将 注意 以 
内 源 性 的 方式 指向 视觉 通道 时 ,被 试 会 倾向 于 选择 性 地 将 注意 集中 在 视觉 通道 ,导致 对 视觉 
通道 信息 的 神经 反应 增强 ， 即 被 试 在 判断 视觉 内 光 刺 激 的 个 数 时 不 容易 受到 听觉 通道 刺激 
的 干扰; 当 被 试 将 注意 以 内 源 性 的 方式 指向 听觉 通道 时 , 被 试 需要 将 注意 分 散在 视觉 通道 和 
听觉 通道 , 相 比 于 集中 注意 单一 视觉 通道 , 被 试 对 听觉 通道 信息 的 神经 反应 增强 , 即 被 试 在 
判断 视觉 内 光 刺 激 的 个 数 时 更 容易 受到 听觉 通道 刺激 的 干扰 。 

本 研究 中 , 注意 内 源 性 地 指向 视觉 通道 可 以 视 为 被 试 在 判断 视觉 闪光 刺激 的 个 数 时 不 
容易 受到 听觉 通道 刺激 的 干扰 ; 注意 内 源 性 地 指向 听觉 通道 可 以 视 为 被 试 在 判断 视觉 闪光 
刺激 的 个 数 时 更 容易 受到 听觉 通道 刺激 的 干扰 ,在 多 感觉 整合 /竞争 的 研究 中 , 一 个 重要 的 影 
响 因 素 就 是 分 心 刺激 在 多 大 程度 上 会 和 目标 刺激 竞争 被 试 的 注意 资源 。 根 据 Lavie (2005) 的 
知觉 负载 理论 ， 相 比 于 无 负载 或 者 低 负 载 条 件 , 被 试 在 高 负载 的 条 件 下 需要 将 注意 全 部 集中 
在 当前 的 任务 , 因此 ， 如 果 被 试 的 注意 被 分 散 到 多 个 感觉 通道 间 ( 高 负载 条 件 )， 那么 被 试 在 
其 中 某 一 个 通道 条 件 下 分 配 的 注意 资源 较 少 ,表现 为 行为 反应 较 差 (Tang, Wu, & Shen, 
2016). 因此, 实验 2 被 试 只 需 注意 单一 的 视觉 通道 , 被 试 在 完成 视觉 判断 任务 时 并 不 受到 听 
觉 通道 刺激 的 干扰 ,表现 为 错觉 量 的 减 小 ; 实验 3 被 试 需要 注意 视觉 和 听觉 双 通 道 , 被 试 在 
完成 视觉 判断 任务 时 会 受到 听觉 通道 刺激 的 干扰 , 表现 为 错觉 量 出 现 增 大 的 趋势 。 
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7 结论 

基于 通道 的 内 源 性 注意 可 以 影响 声音 诱发 双 内 光 错 觉 (裂变 错觉 ) 听 觉 主 导 效 应 ， 即 内 源 
性 地 注意 视觉 通道 使 得 裂变 错觉 减 小 ， 内 源 性 地 注意 听觉 通道 使 得 裂变 错觉 表现 出 增 大 的 
趋势 。 
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Abstract 

The sound-induced flash illusion (SIFI) is an auditory-dominant phenomenon in multisensory 
integration in which the perception of brief visual flashes may be qualitatively altered by 
concurrent brief sounds. It has been well documented how attention modulates this illusion. It 
remains unknown, however, how modal-based endogenous attention interferes with the SIFI. In 
the present study, we adopted the classical paradigm of the SIFI and directed the endogenous 
attention to the visual modal or the auditory modal to investigate the effect of modal-based 
endogenous attention on SIFI. 

Experiment 1 asked the participants to conduct the classical task of the SIFI as the baseline. 
In experiment 2, the ratio of the visual modal, the auditory modal, and the audio-visual modal was 
3:1:1; that is, the endogenous attention was directed to the visual modal. In experiment 3, the ratio 
of the visual modal, auditory modal and audio-visual modal was 1:3:1; that is, the endogenous 
attention was directed to the auditory modal. In the present study, we asked the participants to 
judge the number of flashes, and we focused mainly on the occurrence of fission illusions (when a 
single visual flash is accompanied by two auditory bleeps and is perceived incorrectly as two 
flashes) and fusion illusions (when two visual flashes are accompanied by a single bleep and are 
perceived incorrectly as a single flash). The hypothesis was that directing endogenous attention to 


the visual or auditory modal could affect the auditory dominance. 


£ 


A repeated measures ANOVA was analyzed for fission and fusion illusions separately, and 
the results showed that there were significant differences among the three experiments, F (1, 2) = 
5.11, p < 0.01, n? = 023. The occurrence of fission illusions was decreased when endogenous 
attention was directed to the visual modal (5096) and was increased when endogenous attention 
was directed to the auditory modal (71%). However, regardless of whether endogenous attention 
was directed to the auditory or visual modal, fusion illusion was not affected by attention (ps > 
0.05). In addition, we also pooled the response counts across all of the participants and for both 
fission and fusion stimuli. The results showed that the odds ratio for fission was greater than that 
for fusion, and there was a difference among the three experiments for fission (17.5 vs. 9 vs. 
21.95), and no effect for fusion (4.95 vs. 3.15 vs. 4.13). 

The results indicated that modal-based endogenous attention can affect the occurrence of 
fission illusions but does not affect the occurrence of fusion illusions. The present study provides 


insight into the top-down factors that can modulate sound-induced flash illusions. 


Key words: endogenous attention; auditory dominance; sound-induced flash illusion; visual and 


auditory modals 


